Utilizando WordNet para Complementar la Información de Entrenamiento en la Identificación del Significado de las Palabras
نویسندگان
چکیده
La desambiguación del significado de las palabras se ha desarrollado como una subárea del Procesamiento del Lenguaje Natural (PLN), donde el objetivo es determinar el sentido correcto de aquellas palabras que tienen más de un significado, no es una tarea final en sí misma, sino una tarea intermedia necesaria en variadas aplicaciones del procesamiento del lenguaje natural. La resolución de la ambigüedad de las palabras (WSD) es identificar el sentido correcto de los relacionados en un diccionario, una base de datos léxica o similar. Es una tarea compleja, pero muy útil en variadas aplicaciones del procesamiento en lenguaje natural, como Categorización de Texto (TC); traducción automática; restauración de acentos; encaminamiento y filtrado de textos; agrupamiento y segmentación de textos, corrección ortográfica y gramatical, reconocimiento de voz y, en general, en la recuperación de información. Nuestro enfoque integra información de una base de datos léxica (WordNet) con dos enfoques de entrenamiento a través del Modelo del Espacio Vectorial, incrementando la efectividad de la desambiguación. Probamos los enfoques de entrenamiento con los algoritmos de Rocchio y Widrow-Hoff sobre un gran conjunto de documentos con una fina granularidad de sentidos, como son los de WordNet. Consiguiendo una alta precisión en la resolución de la ambigüedad léxica, así como una gran efectividad en su ejecución.
منابع مشابه
Arquitectura Web para análisis de sentimientos en Facebook con enfoque semántico
Resumen Actualmente el potencial del análisis automático de sentimientos en redes sociales es relevante en el desarrollo de aplicaciones para múltiples propósitos. En este sentido, las publicaciones en Facebook escritas en español pueden contener información semántica relevante que permitiŕıan clasificarlas en categoŕıas de emociones, la complejidad del idioma hace que el análisis de esta infor...
متن کاملInformación colocacional y recuperación de la información
Este proyecto tiene como objetivo investigar la significación de la información colocacional en Recuperación de la información (RI). Una colocación es una relación entre dos unidades léxicas (UL) L1 y L2 tal que para expresar un significado específico en relación con L1 la elección de L2 no es libre (Mel' uk 1995). Así, para expresar el sentido 'hacer lo que está previsto que se debe hacer' en ...
متن کاملSimplificación automática de textos en euskera
En este art́ıculo presentamos el trabajo llevado a cabo dentro del proyecto de tesis doctoral llamado “Egitura sintaktiko konplexuen identifikazioa eta sinplifikazioa euskararen tratamendu automatikoan” (Identificación y simplificación de las estructuras sintácticas complejas en el procesamiento automático del Euskera) que se realiza bajo la dirección de las doctoras Arantza Dı́az de Ilarraza y M...
متن کاملInternet como fuente de información léxica: extracción de etiquetas de dominio y detección de nuevos sentidos
Resumen Describimos un algoritmo que combina información léxica (extráıda de WordNet 1.6) con información en Internet (directorios de Altavista) para caracterizar automáticamente los sentidos de una palabra con etiquetas de dominio y, al mismo tiempo, detectar y describir nuevos sentidos relevantes en Internet. Esta información puede utilizarse, entre otras cosas, para enriquecer bases de datos...
متن کاملEstudio sobre métodos tipo Lesk usados para la desambiguación de sentidos de palabras
Resumen. La ambigüedad semántica es un problema que se presenta en todos los lenguajes naturales. Podríamos decir que para los seres humanos la ambigüedad en el lenguaje pasa desapercibida, debido a que la resolvemos casi inconscientemente utilizando la realidad en que vivimos, el contexto y el conocimiento que poseemos sobre algunos temas. Pero para las computadoras no es así. En el área de pr...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- Inteligencia Artificial, Revista Iberoamericana de Inteligencia Artificial
دوره 3 شماره
صفحات -
تاریخ انتشار 1999